Yarn HA
机器图
1 | hadoop001:zk rm(zkfc) nm |
架构图
1 | - 流程 |
- 补充
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17zkfc
- 只作为RM进程的一个线程而非独立的进程存在
- 监控zk集群的/rmstore是否存在lock文件
RMStateStotr
- 存储在zk的/tmstore目录下
- activeRM会向这个目录写APP信息
- 当activeRM,节点挂了,另外一个RM节点通过ZKFC选举成为active
会从/rmstore读取作业信息,重新构建作业的内存信息
启动内部的服务,开始接受NM的心跳
构建集群的资源信息,并且接口客户端的请求
RM
- 启动时会向ZK的/rmstore目录写一个lock文件,写成功就为active,不成功就为standby
- 所有的rm节点的zkfc线程都会监控zk集群的/rmstore是否存在lock文件,如果不存在就走上一步
- 接收和监控nm的资源状况的汇报,负责资源的分配和调度
- 启动和监控AM